home *** CD-ROM | disk | FTP | other *** search
/ Shareware Overload Trio 2 / Shareware Overload Trio Volume 2 (Chestnut CD-ROM).ISO / dir39 / 2000tech.zip / 2203.TXT < prev    next >
Text File  |  1993-06-15  |  4KB  |  96 lines

  1. Document Number 2203
  2. Recognition Hints and Tips for CatchWord Pro for Windows
  3. 10/26/92
  4.  
  5. 1. Always scan in line-art or black and white mode.
  6.  
  7. There is a feature in CatchWord Pro for Windows which allows you to scan in
  8. 256 grayscale with the ScanMan 256 if your original has a colored
  9. background.  After the scanning process the program converts the image back
  10. to line-art to give the best contrast possible.  This feature should only
  11. be used for originals which do not have white backgrounds.  Otherwise,
  12. scan in line-art mode.
  13.  
  14. 2. Selecting The Right Resolution
  15.  
  16. Most magazines and text books should be scanned at 300 dpi. Use 400 dpi if
  17. the text you are scanning is smaller than standard magazine size.  For
  18. normal sized text (8 to 15 points), 300 dpi is the best resolution. Use 200
  19. dpi if you are scanning large blocks of headline-style type.
  20.  
  21.       Text Size          Scanner Resolution (DPI)
  22.     ----------------------------------------------
  23.      6 to 8  Points     400 DPI gives best results
  24.      9 to 15 Points     300 DPI gives best results
  25.     16 to 20 Points     200 DPI gives best results
  26.  
  27. 3. Adjusting Contrast
  28.  
  29. Contrast control (the relative amounts of black and white) is critical in
  30. obtaining a good scan.  If the text to be scanned is too faint and the
  31. scanned image shows excessive broken characters, then the recognition will 
  32. be poor due to the unrecognized characters.  If the scan is too dark, the 
  33. letters will run together and cause poor recognition.  In any initial 
  34. scanning of a new image, you will need to adjust the contrast.  CatchWord
  35. Pro for Windows tends to prefer a darker contrast, so start with the
  36. contrast setting slightly darker than the middle notch on the scanner.
  37.           
  38. 4. Scanning Speed
  39.  
  40. For the best image quality, experiment with the scanning speed to 
  41. determine the best rate for your computer.  You should be scanning at an 
  42. acceptable rate so the speed indicator light on the scanner head does not
  43. flash. When you scan too fast the characters may look compressed, which
  44. causes character size inconsistencies.  Try to scan a bit slower than the
  45. normal rate recommended by the scanner software, perhaps at about 1/2 to
  46. 1 inch per second. This way the system can receive and process all of the
  47. incoming scanned data in time.
  48.  
  49. Make sure your scanning does not get too far ahead of the real-time
  50. display.  On slower machines the disk access speed cannot keep up the with
  51. the rate of incoming data passed from the scanner to the machine channel.  
  52. Before you hit RETURN to activate Recognition, view the entire image to
  53. check whether all the data is captured to screen.  When you have scanned
  54. too fast for the system, you may notice the final image displayed will have
  55. loss of data, i.e., certain chunks of paragraphs are missing. In this case,
  56. you will have to rescan slower. Scanning too slowly will not affect the
  57. quality of the scanned image.
  58.  
  59. 5. Scanning Straight
  60.  
  61. When the actual scan is slanted, skewed, or jagged, the text will not 
  62. be recognized fully.  Use a hard edge ruler or the edge of a book to help 
  63. scan straight.
  64.  
  65. 6. Practice!
  66.  
  67. As you become more and more familiar with the way CatchWord Pro works -
  68. what it recognizes and what it doesn't - you will find your results
  69. increase dramatically.  
  70.  
  71. 7.  Full Page Scanning
  72.  
  73. You get best results scanning horizontally when attempting to scan a full 
  74. page. Be sure to select the landscape multiple strip scan mode icon.  Begin 
  75. and end each strip at the same place on the page, and overlap four lines of 
  76. text.  You may need to scan in three strips instead of two to get the full 
  77. page scanned.
  78.  
  79. TROUBLESHOOTING
  80.  
  81. Following are the most common reasons why an OCR program may misread text:
  82.  
  83. Unrecognizable fonts or characters.  Omnifont technology recognizes
  84. standard fonts by comparing text characters to features programmed into the
  85. software.  The software will not read characters which don't match
  86. programmed features.  It may also misread similar characters, for example 1
  87. and l.
  88.  
  89. Original document quality directly affects accuracy.  Letters which are 
  90. faint, touching or otherwise illegible may be read inaccurately.
  91. Newspapers, copies and faxes are often poor originals.
  92.  
  93. Uneven or fast scanning, or pausing in mid-scan may result in skewed, 
  94. stretched or compressed text.  Follow the tips above to avoid these causes 
  95. for misrecognition.
  96.